Desambiguación de términos basada en IDF aplicada a recuperación de información

نویسندگان

  • José Manuel Perea Ortega
  • Fernando Martínez Santiago
  • Miguel Ángel García Cumbreras
  • Arturo Montejo Ráez
چکیده

The application of Word Sense Disambiguation (WSD) is usually determined exclusively by the trust in the disambiguation system used. In this paper, a study in the Information Retrieval (IR) field is carried out about the impact of others factors in WSD such as the confidence of the WSD tool, the grade of polisemy or granularity and the difference in the discrimination strength between the original term and the disambiguated one. Thus, a proposal to decide whether a word should be disambiguated or not according to Inverse Document Frequency (IDF) is presented. Finally, it is shown that a selective disambiguation based on IDF improves slightly the performance of an IR system.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Ornitología Virtual: Caracterizando a #Chile en Twitter

Este art́ıculo presenta un análisis de los tweets recolectados el 28 de Octubre de 2012, en el contexto de las elecciones municipales de 2012 en Chile. Dicho análisis se realiza mediante una metodoloǵıa basada en literatura previa, en particular en técnicas de recuperación de la información y de análisis de espacios de información. Como resultado, se determinan: 1) caracteŕısticas demográficas b...

متن کامل

Aplicación de Técnicas de Recuperación de Información a un Glosario de Términos de Internet Desarrollado Utilizando Tecnología JSP

Resumen. En este artículo se describe un sistema que facilita las consultas a un glosario de términos sobre Internet publicado por la Asociación de Técnicos de Informática (ATI). La aplicación permite el acceso a las definiciones de cualquiera de los términos, escritos tanto en inglés como en español. Además, se facilita el mantenimiento del glosario, permitiendo publicar automáticamente nuevos...

متن کامل

Análisis Sintáctico Conducido por un Diccionario de Patrones de Manejo Sintáctico para Lenguaje Español

4 INTRODUCCIÓN 11 CAPÍTULO 1. RETROSPECTIVA HISTÓRICA DE LOS FORMALISMOS GRAMATICALES Y ALGUNAS HERRAMIENTAS EN LINGÜÍSTICA COMPUTACIONAL 31 CAPÍTULO 2. COMPILACIÓN DEL DICCIONARIO DE VERBOS ESPAÑOLES CON SUS ESTRUCTURAS DE VALENCIAS 121 CAPÍTULO 3. ANÁLISIS SINTÁCTICO Y DESAMBIGUACIÓN BASADA EN PATRONES DE MANEJO AVANZADOS 173 CAPÍTULO 4. COLECCIÓN DE ESTADÍSTICAS DE LAS COMBINACIONES DE SUBCA...

متن کامل

Utilizando WordNet para Complementar la Información de Entrenamiento en la Identificación del Significado de las Palabras

La desambiguación del significado de las palabras se ha desarrollado como una subárea del Procesamiento del Lenguaje Natural (PLN), donde el objetivo es determinar el sentido correcto de aquellas palabras que tienen más de un significado, no es una tarea final en sí misma, sino una tarea intermedia necesaria en variadas aplicaciones del procesamiento del lenguaje natural. La resolución de la am...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 46  شماره 

صفحات  -

تاریخ انتشار 2011